论文:The Connected Scatterplot for Presenting Paired Time Series

作者:Steve Haroz, Robert Kosara, and Steven L. Franconeri

发表会议:TVCG 2016

一、简介

Connected scatterplot(后文中简称 CS 图)在数据新闻领域经常被用于可视化一对时序数据序列。CS 图的最初使用案例之一是纽约时报上的一篇关于室友价格和销量的新闻。由于在大数据样本下,CS 图会产生非常复杂的模式而难以理解,因此它往往用于展示任务,而非分析任务。本文主要通过四个用户调研的过程,对 CS 图和以 DALC 图(双轴图,具体介绍见下一节)为代表的其他用于可视化一对时序序列的方法进行对比评估,探究 CS 图与 DALC 图在关于模式理解等任务上的优劣性。

二、CS 图

img

常用的 DALC 图(左,双轴图)用横轴表示时间,左右两个竖轴分别表示两个序列的刻度,两个时序序列在 DALC 图中用两条折线表示。CS 图(右)则分别使用一条横轴以及一条竖轴表示两个序列的刻度,图中每个点对应一个时刻,点的横纵坐标分别对应两个序列的刻度,点与点之间用标示顺序的线连接,标示时间的先后顺序。CS 图中常出现以下两种模式:

img

L 型(上)和环形(下)。其中,L 型的典型特征为线条发生 90 度角的变化,说明这个变量对之间的关系突然发生了明显变化。例如一个变量不发生变化,另一个增加或者减少;环形则表现出交叉的特征,表示两个时序数据之间出现了时间偏移。一个时序序列的局部最高值对应另一个序列的最低值,并且维持一个周期才能产生一个环。

img

上图为 CS 图中典型的有两个变量变化相关性决定的点的移动方式,每队图的左边为 DALC 图,右边为 CS 图。这些典型的点对特征包括:a)两个变量均不发生变化,表现在 CS 图中为点不发生任何移动和变化;b)两个变量中只有一个变量发生了变化,表现在 CS 图中为点在平行于坐标轴的方向上移动;c)d)两个变量具有正相关和负相关的变化关系,表现在 CS 图中在坐标轴上的倾斜角度上变化。

三、user study 1 A

  • 目标:对 CS 图的理解程度的定性研究
  • 14 位被试:本科
  • 两个数据:行车安全、军队数据
  • 形式:非正式访谈
  • 过程:14 名被试分为两组,每组各 7 人,均要用到两个数据,先是行车数据再是军事数据。在展示每组数据的 DALC 图以及 CS 图时,先给出关于这组数据的问题,然后看图,看完以后回答问题。第一组被试在看图的先后顺序上为先看 DALC,再看 CS;第二组反之。
  • 问题:6 个开放性问题,有关形状、初始理解、两个轴变量的总变化等等;7 个趋势描述问题,描述高亮的时间段的变化趋势(包括相关性变化);2 个情境问题,根据图判断给定语义是否正确。
  • 结果:问题正确率非常高,被试在两种图中均发现明显特征(X,L,Loop 等)。但是容易产生两个思维误区,两个图中关于相反趋势的映射是完全不同的以及 CS 图的横纵坐标均表示变量的值。

四、user study 1 B

  • 目标:语义陈述转化为 CS 图、DALC 图的量化研究
  • 14 位被试:本科
  • 两个数据:行车安全、军队数据(修改)
  • 形式:非正式访谈
  • 过程:每个被试都回答若干个个问题,将语义转为 CS 图或者 DALC 图中的趋势线。
  • 问题:9 个明确陈述问题,8 个情境描述问题。
  • 结果:DALC 图的正确率偏高;CS 图反向阅读困难;CS 图 Y1, Y2 均无变化时容易引起困惑。

五、user study 2

  • 目标:两种图互相转化时产生的方向性困惑研究
  • 35 位被试:亚马逊 MTurk 平台招募
  • 每个被试:45min
  • 形式:在线回答问题
  • 过程:CS 图与 DALC 图之间和之内互相转化。每个图包含五个点,用户要将给出的图转化为另一种要求的图形式。任务包含了每种图各自的重要特征。
  • 结果:DALC 图转 DALC 图的正确率为 100%,其他转换中均会造成时间顺序相反、x 轴方向相反等错误。

六、user study 3

  • 目标:CS 图的对用户做任务的吸引力研究
  • 25 位被试:在校学生
  • 6 种数据
  • 形式:眼动数据记录
  • 过程:每个用户浏览一行 6 个视图,每个视图在保留总体结构的基础上尽可能小,隐藏细节。用户可以选择感兴趣的小图点开观察 5min 之内的任意长的时间。
  • 结果:用户刚开始均被 CS 图吸引,但用户对于 DALC 图和 CS 图的全部观察时间之和非常接近。

七、总结:

  1. 文章提出的方法是一种可以参考、改进的时序数据对可视化思路,但是否用于分析复杂情形以及可视分析仍有待商榷

  2. 文章在 user study 的设计和结果总结上有许多值得推敲的地方,仍然需要改进



Questions & Discussion: ✉️ zhangtianye1026@zju.edu.cn